AI资讯新闻榜单内容搜索- DeepSeek-

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: DeepSeek-

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

自首次提出 GPT 架构以来，转眼已经过去了七年。如果从 2019 年的 GPT-2 出发，回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4，不难发现一个有趣的现象：尽管模型能力不断提升，但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报

8449 点击 2025-08-08 11:52

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

近年来，OpenAI o1 和 DeepSeek-R1 等模型的成功证明了强化学习能够显著提升语言模型的推理能力。通过基于结果的奖励机制，强化学习使模型能够发展出可泛化的推理策略，在复杂问题上取得了监督微调难以企及的进展。

来自主题: AI技术研报

6068 点击 2025-07-31 10:10

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能，引起广泛的热度。然而在面对一些无法回答或本身无解的问题时，这些模型竟试图去虚构不存在的信息去推理解答，生成了大量的事实错误、无意义思考过程和虚构答案，也被称为模型「幻觉」问题，如下图（a）所示，造成严重资源浪费且会误导用户，严重损害了模型的可靠性（Reliability）。

来自主题: AI技术研报

8411 点击 2025-07-17 11:24

为什么 DeepSeek 大规模部署很便宜，本地很贵

为什么 DeepSeek 大规模部署很便宜，本地很贵

为什么 DeepSeek 大规模部署很便宜，本地很贵

为什么 DeepSeek-V3 据说在大规模服务时快速且便宜，但本地运行时却太慢且昂贵？为什么有些 AI 模型响应很慢，但一旦开始运行就变得很快？

来自主题: AI技术研报

9187 点击 2025-07-08 11:14

对谈 DeepSeek-Prover 核心作者辛华剑：Multi Agent 天然适合形式化数学｜Best Minds

对谈 DeepSeek-Prover 核心作者辛华剑：Multi Agent 天然适合形式化数学｜Best Minds

对谈 DeepSeek-Prover 核心作者辛华剑：Multi Agent 天然适合形式化数学｜Best Minds

Era of Experience 这篇文章中提到：如果要实现 AGI，构建能完成复杂任务的通用 agent，必须借助“经验”这一媒介，这里的“经验”就是指强化学习过程中模型和 agent 积累的、人类数据集中不存在的高质量数据。

来自主题: AI资讯

8024 点击 2025-06-14 12:58

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit量化之后的 DeepSeek-R1（0528），编程能力依然能超过Claude 4 Sonnet？

来自主题: AI技术研报

7224 点击 2025-06-10 15:28

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

今天，我们正式发布 DeepSeek-R1，并同步开源模型权重。DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API，对用户开放思维链输出，通过设置 `model='deepseek-reasoner'` 即可调用。

来自主题: AI资讯

9414 点击 2025-05-28 21:49

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火，以超低的成本实现了部分超越 OpenAI o1 的表现，一定程度上让人不再过度「迷信」国外大模型。

来自主题: AI技术研报

9950 点击 2025-05-16 09:59

刚刚，DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型

刚刚，DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型

刚刚，DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型

就在刚刚，DeepSeek 在全球最大 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。

来自主题: AI资讯

9361 点击 2025-04-30 20:41

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明，大规模强化学习已成为一种极为有效的方法，能够激发大型语言模型（LLM) 的复杂推理行为并显著提升其能力。

来自主题: AI技术研报

7964 点击 2025-04-23 14:04

上一页当前第2页,共6页下一页